查看原文
其他

mSystem:鸟枪法宏基因组测序之外我们还能做什么

宏基因组 宏基因组 2022-07-05


鸟枪法宏基因组测序之外

Advancing Genome-Resolved Metagenomics beyond the Shotgun

mSystems [6.519]

2019-5-14,Perspective

原文链接:https://doi.org/10.1128/mSystems.00118-19

第一作者:Rex R. Malmstrom

通讯作者:Rex R. Malmstrom, Emiley A. Eloe-Fadrosh

主要单位:美国能源部联合基因组研究所 (Department of Energy Joint Genome Institute, Walnut Creek, California, USA)

摘要

环境微生物组的探索揭示了在自然生态系统中起作用的生态和进化原理,重建群体基因组带来的以基因组为中心的研究进一步加速了其发展。然而,计算繁重的短读长组装群落内的菌株异质性以及低丰度微生物所需的覆盖深度仍然是传统鸟枪法宏基因组学要应对的技术挑战。从这个角度出发,我们提出了未来有希望发展的三个主要方向,包括耦合稳定性同位素示踪技术与宏基因组、应用荧光激活细胞分选技术在较大的群落中靶向寻找微型宏基因组,以及利用单分子长读长合成长读长技术将可移动元件与宿主微生物细胞相链接。这些开始显现的发展无疑将推进基因组分辨的宏基因组学(genome-resolved metagenomics)的分析方法,并使人们能够更好地了解未培养微生物与其生长的自然环境。

关键词

DNA稳定性同位素示踪(DNA-SIP), 基因组分辨的宏基因组学(genome-resolved metagenomics), 微生物组(microbiome)

前言

目前已测序的细菌和古菌的完整基因组或基因组草图已达到一个惊人的体量,公共数据库中现可以查询到超过182,000个记录(1)。这个基因组库提供了微生物代谢和功能潜力的基础参考,实验室中的工作可以从这个数据库中验证基于序列的预测。然而,迄今为止,绝大多数微生物都没有得到培养,目前只有通过鸟枪法宏基因组测序单细胞基因组测序等非培养的方法,才能了解它们的基因组成。最近在宏基因组数据集的大规模组装和分箱(binning)方面取得的进展,使得重建种群水平的基因组草图成为可能,从而对未培养细菌和古菌的进化和代谢特性进行了重要的研究(2–5)。基因组分辨的数据分析提供了一个可以通过分类地位锚定不同微生物群落的独特的机会,加强了对群落结构和功能的解释,并使系统生物学方法成为可能,而且为宿主相关模型和地球系统模型提供了信息。

基因组分辨的宏基因组学(genome-resolved metagenomic)方法的一个主要限制在于初始样本采集的非靶向性和大批量性。虽然我们现在可以比以往任何时候都进行更深度的测序,并使用越来越强大的超算,但我们仍然需要比大规模群落鸟枪法测序更聪明的方法,以便在微生物种和株的水平上获取信息,并将使其与功能联系起来。我们认为,更有针对性的基因组分辨的宏基因组学方法将把该领域从“提出假设”推进到“检验假设”的阶段。

耦合稳定性同位素示踪与基因组分辨的宏基因组学

COUPLING STABLE ISOTOPE PROBING AND GENOME-RESOLVED METAGENOMICS

DNA稳定同位素示踪(DNA-SIP)能够基于同位素标记(如^13^C、^15^N 和^18^O)底物的吸收和掺入来有针对性地富集活性微生物(6)。这种方法将微生物群落与同位素标记的化合物共培养,然后从中提取 DNA,将其沿着氯化铯密度梯度分离成不同的组分,这样以来高密度的组分就可以被“较重的”同位素标记的 DNA 富集。之后我们可以通过微生物 DNA 密度的变化来推断标记化合物的同化作用,从而使DNA-SIP成为将微生物与特定的代谢过程在原位联系起来的有力工具。

许多 DNA-SIP 研究利用16S rRNA 标记基因的高通量测序来探索系统发育和原位功能之间的联系(7,–9)。在这些研究中,16S rRNA 基因序列以97% 的序列相似度聚簇成 OTUs,以减少方法学上的误差,然而这些 OTUs 其实可能包含不同的群体组成,它们在基因含量和活性上有很大的差异。鸟枪法测序获得的片段使基因组分辨的 DNA-SIP 成为可能,跟踪标记基因组而不是标记基因,可以在具有高16S rRNA 相似性的密切相关的共存种群中区分不同的功能活性。更重要的是,以基因组学为中心的分析方法(genome-centric approach)可以提供仅标记基因不能够提供的微生物组功能方面的信息。也就是说,虽然16S rRNA 测序表明了谁吸收了标记的底物,但是以基因组为中心的方法还可以重建其代谢通路,为这些底物如何以及为什么可以被用于特定途径提供了新见解。

除了功能方面,与 DNA-SIP 相关的分级步骤可以帮助从复杂群落中全面恢复基因组。在测序之前,通过非随机地将一个群落的 DNA 分成几十个部分,就有可能增加某些稀有微生物在某些组分的相对丰度,从而实现比鸟枪法DNA测序更大的覆盖范围。例如, Starr 和他的同事们从一个特定密度的组分得到了一个完整的Saccharibacteria基因组,而这个基因组在整个宏基因组中只有小于1×的覆盖度(10)。

尽管 DNA-SIP 具有潜在的力量,但它的应用受到了一定程度的限制,至少在某种程度上受到了所涉及的繁琐程序的限制。开发自动的DNA-SIP技术方法将减少可变性,同时提高通量和总体的易用性。我们预测,自动化流程的进步将激发大量的测量未培养微生物群落原位功能活性的研究。同时,我们还需要新的信息学方法来最大限度地组装分布在不同组分的基因组。

靶向探索“微型宏基因组”

TARGETED “MINI-METAGENOMES”

在 DNA 提取和测序之前,复杂的微生物群落也可以被分为更小的、多样性不高的子类群。微流控分区(microfluidic partitioning)是一种产生微型宏基因组的简便方式,其方法是在裂解前将细胞编为小组并随机分配到微反应室中,然后创建文库(11)。荧光激活细胞分选 (FACS)是一种复杂但更灵活和精确的方法,能够随机、或非随机地得到微型宏基因组。例如,使用后一种方法,有研究团队从森林土壤中恢复了几个未培养的巨型病毒的基因组(12)。有趣的是,这些病毒基因组不能够通过相同土壤样本的深度鸟枪法测序组装出来,这说明将复杂的群落细分为低多样性的微型基因组可以使稀有类群恢复,这些稀有类群可能在使用传统的整体宏基因组测序方法中被忽略。

无论采用何种细胞分离方法,微型宏基因组学与整体鸟枪法宏基因组测序的结合为改善未培养微生物谱系的基因组恢复带来了巨大的希望。结合考虑重叠群(contig)的覆盖度在不同样本间的协方差可以显著改善宏基因组分箱的效果(13),但是收集数十个样本来最大化覆盖度的协方差是一个重要的,有时是难以克服的挑战。将一个群落细分为几十个微型宏基因组,生成具有不同系统发育组成的多个样本,算法可以利用这些微型宏基因组之间的覆盖度协方差来改善分箱。例如,Yu 和他的同事通过分析从一个热泉群落产生的几个微型宏基因组中发现的共现(cooccurring)contigs的存在 / 缺失模式(11),改进了基因组恢复的效果。这些共现关系和不同的覆盖模式也可以用来对相应的整体宏基因组测序产生的重叠群进行分箱。我们认为,微型宏基因组学和整体宏基因组学混合的方法类似于有前景的 MetaSort 方法(14,中科院北京生科院赵方庆团队开发的技术和算法) ,更好地利用了微型宏基因组之间的差异覆盖模式,能够很大程度改善基因组分箱。

微型宏基因组学也可以与功能标记相结合,重点分析感兴趣的微生物。生物正交非经典氨基酸标记法(bio-orthogonal noncanonical amino acid tagging,BONCAT)是一种对活跃的合成新蛋白的细胞进行荧光标记的方法,它可以与上述的荧光激活细胞分选FACS方法结合生成仅由有代谢活性的微生物组成的微型宏基因组(15)。鉴定并特异性测序活性细胞对于确定微生物基因组和环境过程之间的联系至关重要,特别是在某些特殊环境中,大多数细胞在任何时间可能都生长非常缓慢。拉曼细胞分选(raman-activated cell sorting,RACS)以后也可能用来特别分选活跃的细胞,例如分选在 D~2~O 孵育过程中同位素标记的细胞(16)。与BONCAT+FACS相比,SIP+RACS组合提供了基于更特定的代谢功能来测序微型宏基因组的可能性,例如,识别能够同化各种^13^C- 或^15^N- 标记的有机化合物的细胞,而不是简单的“活性”细胞。这种方法将是 DNA-SIP 的一个强有力的伙伴,实质上为 DNA-SIP 产生的模拟信号提供了一个数字补充,让我们更加清晰地了解细胞之间的变化。有些化合物中的元素没有出现在核酸中,而SIP+RACS能使对这种类型化合物的分选和测序成为可能,这是 DNA-SIP 无法做到的。我们希望在未来实现基于自然微生物群落的SIP+RACS工程化解决方案。

链接可移动元件与微生物宿主

LINKING MOBILE ELEMENTS TO MICROBIAL HOST CELLS

除了改进直接从环境中重建基因组的方法之外,利用单分子长读长(single-molecule long-read)和合成长读长(synthetic long-read)技术为探索可移动元件(特别是质粒)与宿主微生物细胞的关系提供了独特的机会。质粒介导的基因水平转移影响微生物群落结构和进化,其能够传输不同的功能给微生物,并在系统发育的群体之间进行基因交换。对于自然种群中质粒在大小、结构和传播机制方面的多样性,我们知之甚少。从环境样本中直接分离质粒存在局限性,而使用标准的鸟枪法测序进行精确预测也同样存在局限性。

新的工具为在微生物宿主和质粒之间建立牢固的联系带来了巨大的希望。例如,Hi-C 等邻近连接(proximity-linking)方法可以在文库创建和测序之前将质粒 DNA 与宿主染色体 DNA 物理连接,从而在质粒和宿主基因组之间建立清晰的联系(17)。微生物宿主特异性 DNA 甲基化模式也可以用来鉴定质粒的来源(详见 NBT: 宏表观组—DNA甲基化辅助宏基因组binning)。也就是说,不同的微生物针对不同的序列模体通常编码不同的甲基转移酶; 因此,一个质粒的宿主可以通过匹配甲基化基序来确定。Beaulaurier和他的同事巧妙地利用了这种联系,使用 PacBio 单分子实时测序(SMRT)从人工合成和自然的微生物群落中确定了质粒和染色体序列的甲基化基序,并且能够将质粒找到其来源的宿主(18)。虽然很少有研究利用单分子长读长和合成长读长技术将质粒连接到它们各自的宿主微生物细胞上,但我们预计这些方法将在未来获得动力,扩展我们目前对不同质粒的了解。

总之,目标性的基因组分辨的宏基因组学方法的进展正持续提供在环境微生物群落内获得更大分辨率的方法。通过基因组分辨的 DNA-SIP 和微型宏基因组学方法,功能活性测量可以以基因组为中心的方式直接与未培养的微生物联系起来,使我们越来越接近在原位进行猜想的检验。同样,单分子长读长和合成长读长的技术提供了一种靶向研究与宿主相关的可移动基因元件的手段,并进一步扩大了我们对未培养微生物的认识。

Reference

Rex R. Malmstrom & Emiley A. Eloe-Fadrosh. Advancing Genome-Resolved Metagenomics beyond the Shotgun. mSystems 4, e00118-00119, doi:10.1128/mSystems.00118-19 (2019).

https://msystems.asm.org/content/4/3/e00118-19.full

编译:林禾雨 墨尔本大学

责编:刘永鑫 中科院遗传发育所

猜你喜欢

10000+:菌群分析 宝宝与猫狗 梅毒狂想曲 提DNA发Nature Cell专刊 肠道指挥大脑

系列教程:微生物组入门 Biostar 微生物组  宏基因组

专业技能:学术图表 高分文章 生信宝典 不可或缺的人

一文读懂:宏基因组 寄生虫益处 进化树

必备技能:提问 搜索  Endnote

文献阅读 热心肠 SemanticScholar Geenmedical

扩增子分析:图表解读 分析流程 统计绘图

16S功能预测   PICRUSt  FAPROTAX  Bugbase Tax4Fun

在线工具:16S预测培养基 生信绘图

科研经验:云笔记  云协作 公众号

编程模板: Shell  R Perl

生物科普:  肠道细菌 人体上的生命 生命大跃进  细胞暗战 人体奥秘  

写在后面

为鼓励读者交流、快速解决科研困难,我们建立了“宏基因组”专业讨论群,目前己有国内外5000+ 一线科研人员加入。参与讨论,获得专业解答,欢迎分享此文至朋友圈,并扫码加主编好友带你入群,务必备注“姓名-单位-研究方向-职称/年级”。PI请明示身份,另有海内外微生物相关PI群供大佬合作交流。技术问题寻求帮助,首先阅读《如何优雅的提问》学习解决问题思路,仍未解决群内讨论,问题不私聊,帮助同行。

学习16S扩增子、宏基因组科研思路和分析实战,关注“宏基因组”

点击阅读原文,跳转最新文章目录阅读

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存